Stable Diffusion 3 图像生成模型紧急更新

“根据 Emad的暗示和发布的演示，Stable Diffusion 3（稳定扩散3）模型具备视频生成能力，可以说是经过改进的Sora的一种版本。

Stability AI目前有货，并发布了Stable Diffusion 3模型。该模型在多主题提示、图像质量和拼写能力方面表现出了极大的提高。

Stable Diffusion 3模型的参数范围从800M到8B。这项技术采用了一种名为扩散变换器（Diffusion Transformer）的新型架构，结合了光流学匹配和其他技术上的改进。通过利用Transformer的最新改进，该技术不仅能够应用于更广泛的领域，还能处理多种类型的输入数据，包括多模态输入。

Stability AI还声称，他们已根据Spawning AI的Do Not Train注册表清理了所有数据集，其中包括超过15亿个选择退出请求和其他手动请求发送给Stability AI的数据。”

这里申请早期访问权限：https://stability.ai/stablediffusion3，可以通过点击，连接申请访问权限，如图所示；

Stable Diffusion 3 图像生成模型紧急更新

我们先来看看对应的stable diffusion 一些效果吧；

Stable Diffusion 3 图像生成模型紧急更新

内容发布

Stability AI在2月22日发布了他们最新的模型Stable Diffusion 3.0（简称为SD 3.0）。

在发布公告中，他们将SD 3.0描述为其功能最强大的模型，并特别强调了它采用了Diffusion Transformer架构（有和 Sora模型的竞争的意思）。

目前，他们尚未提供模型资源，但感兴趣的人可以加入等候名单以体验该模型。

加入等候名单： https://stability.ai/stablediffusion3

Stable Diffusion 3 图像生成模型紧急更新

我们来看看一些社区案例中优秀作品，可以看出对应的作品有了很大的改进；

Stable Diffusion 3 图像生成模型紧急更新

主体改进方案

总的来说改进方面可以从下面看出，

支持文本渲染

性能提升

多目标提示

更好的图像质量

对于文本点渲染能力的话，其实一开始主要依托于对应自己的主模型，其实本身的渲染能力比较一般，我们来看看用官网中给的一段渲染词汇得到的图，用MJ做一下对比

Stable Diffusion 3 图像生成模型紧急更新

Prompt: "Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says “Stable Diffusion 3” made out of colorful energy "

提示:“史诗般的动漫作品，一个巫师在夜晚的山顶上向黑暗的天空施放宇宙咒语，咒语上写着“稳定扩散 3”，由五彩缤纷的能量组成

Stable Diffusion 3 图像生成模型紧急更新